智能论文笔记

Feedback Control of Millimeter Scale Pivot Walkers Using Magnetic Actuation

Ehab Al Khatib , Pouria Razzaghi , Yildirim Hurmuzlu

分类：机器人

2021-11-06

外部磁场可用于远程控制小尺寸的机器人，使其具有多样化的生物医学和工程应用的候选人。我们表明，我们的磁动毫罗罗布特是高度敏捷的，并且可以执行各种机车任务，例如枢轴行走和在水平面翻滚。在这里，我们专注于控制枢轴行走模式中该毫无米罗罗布特的运动效果。开发了系统的数学模型，派生了运动模型。还研究了机器人运动中扫描和倾斜角度的作用。我们提出了两个控制器来调节枢轴步行者的步态。第一个是比例几何控制器，它决定了Millobot应该使用的正确枢轴点。然后，它基于毫无槌和参考轨迹的中心之间的误差按比例地调节角速度。第二控制器基于梯度下降优化技术，其表示控制动作作为优化问题。这些控制算法使得MilliRobot能够在跟踪所需的轨迹时产生稳定的步态。我们进行一组不同的实验和模拟运行，以确定所提出的控制器在跟踪误差方面的不同扫描和倾斜角度的有效性。这两个控制器表现出适当的性能，但观察到基于梯度下降基于的控制器产生更快的收敛时间，更小的跟踪误差和更少的步数。最后，我们对扫描角度，倾斜角度和步进时间对跟踪误差的影响进行了广泛的实验参数分析。正如我们所预期的那样，基于优化的控制器优于基于几何的控制器。

translated by 谷歌翻译

Swarm Control of Magnetically Actuated Millirobots

Pouria Razzaghi , Ehab Al Khatib , Yildirim Hurmuzlu

分类：机器人

2021-11-06

小型机器人提供对更大的空间的访问空间。这种类型的访问在药物递送，环境检测和小型样品的集合之类的应用中至关重要。然而，有一些任务是不可能使用包括组装和制造的一个机器人，以小规模，操纵微型和纳米物体，以及基于机器人的小规模材料的结构。解决此问题的解决方案是使用一组机器人作为系统。因此，我们专注于可以使用一组小规模机器人实现的任务。这些机器人通常由于其尺寸限制而外部驱动。然而，一个人面临使用单个全局输入控制一组机器人的挑战。我们提出了一种控制算法，以在预定义位置定位蜂拥的各个成员。单个控制输入适用于系统，并以相同的方向移动所有机器人。我们还通过使用不同的长度机器人添加另一个控制模态。电磁线圈系统施加外力并转向毫流。这个毫米可以以各种运动模式移动，如枢轴行走和翻滚。我们提出了两个毫无罗罗波茨的新设计。在第一设计中，磁体放置在主体的中心以减小磁吸引力。在第二种设计中，毫米的长度相同，具有两条额外的腿作为枢轴点。这样，我们在设计中变化分离时可以利用枢轴行走模式的变速，同时保持翻滚模式的速度恒定。本文介绍了一种具有不同长度的N毫米的位置控制的一般算法，使它们从给定的初始位置移动到最终所需位置。该方法基于选择完全可控的领导者。仿真和硬件实验验证了这些结果。

translated by 谷歌翻译

GRelPose: Generalizable End-to-End Relative Camera Pose Regression

Fadi Khatib , Yuval Margalit , Meirav Galun , Ronen Basri

分类：计算机视觉

2022-11-27

This paper proposes a generalizable, end-to-end deep learning-based method for relative pose regression between two images. Given two images of the same scene captured from different viewpoints, our algorithm predicts the relative rotation and translation between the two respective cameras. Despite recent progress in the field, current deep-based methods exhibit only limited generalization to scenes not seen in training. Our approach introduces a network architecture that extracts a grid of coarse features for each input image using the pre-trained LoFTR network. It subsequently relates corresponding features in the two images, and finally uses a convolutional network to recover the relative rotation and translation between the respective cameras. Our experiments indicate that the proposed architecture can generalize to novel scenes, obtaining higher accuracy than existing deep-learning-based methods in various settings and datasets, in particular with limited training data.

translated by 谷歌翻译

Elly: A Real-Time Failure Recovery and Data Collection System for Robotic Manipulation

Elena Galbally , Adrian Piedra , Cynthia Brosque , Oussama Khatib

分类：机器人

2022-08-25

即使是最强大的自主行为也可能失败。这项研究的目的是在自主任务执行期间恢复和从失败中收集数据，以便将来可以防止它们。我们建议对实时故障恢复和数据收集进行触觉干预。Elly是一个系统，可以在自主机器人行为和人类干预之间进行无缝过渡，同时从人类恢复策略中收集感觉信息。系统和我们的设计选择在单臂任务上进行了实验验证 - 在插座中安装灯泡 - 以及双层任务 - 拧上瓶盖的帽子 - 使用两个配备的4手指握把。在这些示例中，Elly在总共40次运行中实现了超过80％的任务完成。

translated by 谷歌翻译

HTML版本

A Language Model for Text Analytics in Cybersecurity

Ehsan Aghaei , Xi Niu , Waseem Shadid , Ehab Al-Shaer

分类：自然语言处理 | 人工智能

2022-04-06

NLP是与计算机或机器理解和解释人类语言的能力有关的人工智能和机器学习的一种形式。语言模型在文本分析和NLP中至关重要，因为它们允许计算机解释定性输入并将其转换为可以在其他任务中使用的定量数据。从本质上讲，在转移学习的背景下，语言模型通常在大型通用语料库上进行培训，称为预训练阶段，然后对特定的基本任务进行微调。结果，预训练的语言模型主要用作基线模型，该模型包含了对上下文的广泛掌握，并且可以进一步定制以在新的NLP任务中使用。大多数预训练的模型都经过来自Twitter，Newswire，Wikipedia和Web等通用领域的Corpora培训。在一般文本中训练的现成的NLP模型可能在专业领域效率低下且不准确。在本文中，我们提出了一个名为Securebert的网络安全语言模型，该模型能够捕获网络安全域中的文本含义，因此可以进一步用于自动化，用于许多重要的网络安全任务，否则这些任务将依靠人类的专业知识和繁琐的手动努力。 Securebert受到了我们从网络安全和一般计算域的各种来源收集和预处理的大量网络安全文本培训。使用我们提出的令牌化和模型权重调整的方法，Securebert不仅能够保留对一般英语的理解，因为大多数预训练的语言模型都可以做到，而且在应用于具有网络安全含义的文本时也有效。

translated by 谷歌翻译

Inverse deep learning methods and benchmarks for artificial electromagnetic material design

Simiao Ren , Ashwin Mahendra , Omar Khatib , Yang Deng , Willie J. Padilla , Jordan M. Malof

分类：机器学习

2021-12-19

深度学习（DL）逆技术增加了人工电磁材料（AEM）设计的速度，提高了所得装置的质量。许多DL逆技术在多个AEM设计任务中成功地成功，但要比较，对比度和评估各种技术，澄清逆问题的潜在弊端是至关重要的。在这里，我们审查最先进的方法，并对深度学习逆方法进行全面调查，对AEM设计进行深度学习逆方法和可逆和有条件可逆的神经网络。我们可以轻松访问和快速可实现的AEM设计基准，该基准提供了一种有效地确定最适合解决不同设计挑战的DL技术的方法。我们的方法是通过对重复模拟的限制和易于集成度量的限制，我们提出的是任何AEM设计问题的相对弊端。我们表明，由于问题变得越来越弊，无论模拟约束如何，带有边界损耗（NA）的神经伴随都会产生更好的解决方案。在简单的AEM设计任务中，当模拟有限时，直接神经网络（NN）更好，而混合密度网络（MDN）和条件变化自动编码器（VAE）预测的几何形状可以通过持续的采样和重新模拟来改进。

translated by 谷歌翻译

VocBench: A Neural Vocoder Benchmark for Speech Synthesis

Ehab A. AlBadawy , Andrew Gibiansky , Qing He , Jilong Wu , Ming-Ching Chang , Siwei Lyu

分类：自然语言处理

2021-12-06

用于将音频信号的光谱表示转换为波形的神经声学器是语音合成管道中的常用组件。它侧重于合成来自低维表示的波形，例如MEL-谱图。近年来，已经引入了不同的方法来开发这种声音。但是，评估这些新的声音仪并将其表达与以前的声学相比，它变得更具挑战性。为了解决这个问题，我们呈现VOCBENCH，这是一个框架，该框架是基于最先进的神经声码器的性能。 VOCBENCH使用系统研究来评估共享环境中的不同神经探测器，使它们能够进行公平比较。在我们的实验中，我们对所有神经副探测器的数据集，培训管道和评估指标使用相同的设置。我们执行主观和客观评估，以比较每个声码器沿不同的轴的性能。我们的结果表明，该框架能够为每种声学器提供竞争的疗效和合成样品的质量。 Vocebench框架可在https://github.com/facebookResearch/Vocoder-Benchmark中获得。

translated by 谷歌翻译

Blaschke Product Neural Networks (BPNN): A Physics-Infused Neural Network for Phase Retrieval of Meromorphic Functions

Juncheng Dong , Simiao Ren , Yang Deng , Omar Khatib , Jordan Malof , Mohammadreza Soltani , Willie Padilla , Vahid Tarokh

分类：机器学习

2021-11-26

许多物理系统由普通的或部分微分方程描述，其解决方案由复杂域中的全象或亚纯函数给出。在许多情况下，只有在纯虚拟JW轴上的各个点上只观察到这些功能的大小，因为它们的阶段的相干测量通常是昂贵的。然而，期望在可能的情况下从幅度中检索丢失的阶段。为此，我们提出了一种基于Blaschke产品的物理漏险的深神经网络，用于相位检索。灵感来自赫尔森和Sarason定理，我们使用Blaschke产品神经网络（BPNN）来恢复Blaschke产品的合理功能系数，基于输入作为输入的幅度观察。然后使用得到的Rational函数进行相位检索。我们将BPNN与常规深度神经网络（NNS）进行比较多相检索问题，包括合成和当代的现实世界问题（例如，数据收集需要大量专业知识的超材料，并且耗时）。在每个阶段检索问题上，我们与不同尺寸和超参数设置的传统NNS群体进行比较。即使没有任何超参数搜索，我们发现BPNNS始终如一地优于稀缺数据场景中优化NNS的群体，并且尽管模型更小。结果又可以应用于计算超材料的折射率，这是物质科学新兴领域的重要问题。

translated by 谷歌翻译

WSR: A WiFi Sensor for Collaborative Robotics

Ninad Jadhav , Weiying Wang , Diana Zhang , Oussama Khatib , Swarun Kumar , Stephanie Gil

分类：机器人

2020-12-08

在本文中，我们推导了机器人来测量相对方向或到达角度（AOA）的新能力，以在非视线和未映射的环境中运行的其他机器人，而无需外部基础架构。我们通过捕获WiFi信号在从发送到接收机器人时遍历的所有路径来这样做，这是我们术语AOA简档。当机器人在3D空间中移动时，关键直觉是“在空中模拟空气中的天线阵列”，一种类似于合成孔径雷达（SAR）的方法。主要贡献包括i）一个框架，以适应任意3D轨迹的框架，以及所有机器人的持续移动性，而计算AOA配置文件和II）随附的分析，其提供了作为机器人轨迹的函数的AOA估计方差的较低限制基于Cramer Rao绑定的几何。这是一个关键的区别与先前的SAR的工作，限制机器人移动到规定的运动模式，不概括到3D空间，和/或在数据采集时段期间需要将机器人发送到静态。我们的方法导致更准确的AOA配置文件，从而更好地估计，并正式地将该观察表征为轨迹的信息性;我们推导出封闭形式的可计算量。所有理论发展都是通过广泛的模拟和硬件实验证实的。我们还表明，我们的配方可以与现成的轨迹估计传感器一起使用。最后，我们展示了我们系统对多机器人动态集合任务的表现。

translated by 谷歌翻译

Procedural Humans for Computer Vision

Charlie Hewitt , Tadas Baltrušaitis , Erroll Wood , Lohit Petikam , Louis Florentin , Hanz Cuevas Velasquez

分类：计算机视觉

2023-01-03

Recent work has shown the benefits of synthetic data for use in computer vision, with applications ranging from autonomous driving to face landmark detection and reconstruction. There are a number of benefits of using synthetic data from privacy preservation and bias elimination to quality and feasibility of annotation. Generating human-centered synthetic data is a particular challenge in terms of realism and domain-gap, though recent work has shown that effective machine learning models can be trained using synthetic face data alone. We show that this can be extended to include the full body by building on the pipeline of Wood et al. to generate synthetic images of humans in their entirety, with ground-truth annotations for computer vision applications. In this report we describe how we construct a parametric model of the face and body, including articulated hands; our rendering pipeline to generate realistic images of humans based on this body model; an approach for training DNNs to regress a dense set of landmarks covering the entire body; and a method for fitting our body model to dense landmarks predicted from multiple views.

translated by 谷歌翻译